Projet 5 - Segmentation des Clients d'un Site E-Commerce

Partie 2 de 3

1. Résumé

L'objectif du projet est de segmenter des clients du site e-commerce, ce qu'inclu :

Dans le premier notebook du projet on a consolidé les informations sur les commandes et les clients dans deux datasets. On a aussi fait un nettoyage et un exploration des données pour ce préparer au modélisation. Dans ce notebook, on test plusieurs modèles avec des différents features et nombre de clusters.

2. Les Imports

2.1 Les Bibliothèques et Styles

2.2 Les Données

3. Les Généralités et Fonctions

3.1 Initialisation des Dictionnaires et Préferences

3.2 Le Prétraitement

3.2.1 Transformers Personnalisés

3.2.2 Création des Préprocesseurs

3.3 Evaluation, Collection des Informations

3.4 Visualisation

4. Exploration des Données

4.1 Matrix de Corrélation

4.2 Réduction de Dimension

4.2.1 Choix des Features

4.2.2 PCA

4.2.3 Factor Analysis

4.3 Projection en 2D

4.3.4 Choix des Features

4.3.5 Réduction de Nombre d'Entrées

4.3.6 MDS

4.3.7 Isomap

4.3.8 Locally Linear Embedding

4.3.9 t-SNE

Paramètres de Défaut

-- BREAK Store/Reload Data --

5. Modèles - Vérsion 0

5.1 Sélection des Features

5.2 Créations des Projections

PCA

MDS

Isomap

t_SNE

-- BREAK Store/Reload Data --

5.3 K-Means - Vérsion 0

5.3.1 Evaluation du Modèle

5.3.2 Choisir un Modèle

5.3.3 Visualisation des Clusters en 2-D

5.3.4 Distributions des Features par Groupe

Tableau - résumé

Tableau - détails

Boxplots

Scatterplots

5.4 GaussianMixture - Vérsion 0

5.4.1 Evaluation du Modèle

5.4.2 Choisir un Modèle

5.4.3 Visualisation des Clusters en 2-D

5.4.4 Distributions des Features par Groupe

Tableau - resumé

Tableau - détails

Boxplots

5.4.5 Choisir un Modèle -2

5.4.6 Visualisation des Clusters en 2-D -2

5.4.7 Distributions des Features par Groupe -2

Tableau - résumé

Tableau - détails

Boxplots

5.5 BIRCH - Vérsion 0

5.5.1 Evaluation du Modèle

5.5.2 Choisir un Modèle

5.5.3 Visualisation des Clusters en 2-D

5.5.4 Distributions des Features par Groupe

Tableau - résumé

Tableau - détails

Boxplots

6. Modèles - Vérsion 1

6.1 Sélection des Features

6.2 Créations des Projections

PCA

MDS

Isomap

t_SNE

-- BREAK Store/Reload Data --

6.3 K-Means - Vérsion 1

6.3.1 Evaluation du Modèle

6.3.2 Choisir un Modèle

6.3.3 Visualisation des Clusters en 2-D

6.3.4 Distributions des Features par Groupe

Tableau - résumé

Tableau - détails

Boxplots

Scatterplots

6.3.5 Choisir un Modèle -2

6.3.6 Visualisation des Clusters en 2-D -2

6.3.7 Distributions des Features par Groupe -2

Tableau - résumé

Tableau - détails

Boxplots

6.3.8 Choisir un Modèle -3

6.3.9 Visualisation des Clusters en 2-D -3

6.3.10 Distributions des Features par Groupe -3

Tableau - résumé

Tableau - détails

Boxplots

6.4 GaussianMixture - Vérsion 1

6.4.1 Evaluation du Modèle

6.4.2 Choisir un Modèle

6.4.3 Visualisation des Clusters en 2-D

6.4.4 Distributions des Features par Groupe

Tableau - resumé

Tableau - détails

Boxplots

6.5 BIRCH - Vérsion 1

6.5.1 Evaluation du Modèle

6.5.2 Choisir un Modèle

6.5.3 Visualisation des Clusters en 2-D

6.5.4 Distributions des Features par Groupe

Tableau

Boxplots

6.6 DBSCAN - Vérsion 1

6.3.1 Evaluation du Modèle

6.3.2 Choisir un Modèle

6.3.4 Distributions des Features par Groupe

Tableau - détails

Boxplots

6b. Modèles - Vérsion 1b

6b.1 Sélection des Features

6b.2 Créations des Projections

PCA

MDS

Isomap

t_SNE

-- BREAK Store/Reload Data --

6b.3 K-Means - Vérsion 1b

6b.3.1 Evaluation du Modèle

6b.3.2 Choisir un Modèle

6b.3.3 Visualisation des Clusters en 2-D

6b.3.4 Distributions des Features par Groupe

Tableau - résumé

Tableau - détails

Boxplots

6b.4 GaussianMixture - Vérsion 1b

6b.4.1 Evaluation du Modèle

6b.4.2 Choisir un Modèle

6b.4.3 Visualisation des Clusters en 2-D

6b.4.4 Distributions des Features par Groupe

Tableau - resumé

Tableau

Boxplots

6b.4.5 Choisir un deuxième Modèle -2

6b.4.6 Visualisation des Clusters en 2-D -2

6b.4.7 Distributions des Features par Groupe - 2

Tableau - résumé

Tableau - détails

Boxplots

6b.5 BIRCH - Vérsion 1b

6b.5.1 Evaluation du Modèle

6b.5.2 Choisir un Modèle

6b.5.3 Visualisation des Clusters en 2-D

6b.5.4 Distributions des Features par Groupe

Tableau - resumé

Tableau - détails

Boxplots

7. Modèles - Vérsion 2

7.1 Sélection des Features

7.2 Créations des Projections

PCA

MDS

Isomap

t_SNE

-- BREAK Store/Reload Data --

7.3 K-Means - Vérsion 2

7.3.1 Evaluation du Modèle

7.3.2 Choisir un Modèle

7.3.3 Visualisation des Clusters en 2-D

7.3.4 Distributions des Features par Groupe

Tableau

Boxplots

Scatterplots

7.4 GaussianMixture - Vérsion 2

7.4.1 Evaluation du Modèle

7.4.2 Choisir un Modèle

7.4.3 Visualisation des Clusters en 2-D

7.4.4 Distributions des Features par Groupe

Tableau - resumé

Tableau - détails

Boxplots

7.4.5 Choisir un Modèle - 2

7.4.6 Visualisation des Clusters en 2-D -2

7.4.7 Distributions des Features par Groupe -2

Tableau -résumé

Tableau -détails

Boxplots

7.5 BIRCH - Vérsion 2

7.5.1 Evaluation du Modèle

7.5.2 Choisir un Modèle

7.5.3 Visualisation des Clusters en 2-D

7.5.4 Distributions des Features par Groupe

Tableau

Boxplots

7b. Modèles - Vérsion 2b

7b.1 Sélection des Features

7b.2 Créations des Projections

PCA

MDS

Isomap

t_SNE

-- BREAK Store/Reload Data --

7b.3 K-Means - Vérsion 2b

7b.3.1 Evaluation du Modèle

7b.3.2 Choisir un Modèle

7b.3.3 Visualisation des Clusters en 2-D

7b.3.4 Distributions des Features par Groupe

Tableau - resumé

Tableau - détails

Boxplots

7b.4 GaussianMixture - Vérsion 2b

7b.4.1 Evaluation du Modèle

7b.4.2 Choisir un Modèle

7b.4.3 Visualisation des Clusters en 2-D

7b.4.4 Distributions des Features par Groupe

Tableau - resumé

Tableau - détails

Boxplots

7b.4.5 Choisir un Modèle - 2

7b.4.6 Visualisation des Clusters en 2-D -2

7b.4.7 Distributions des Features par Groupe -2

Tableau -résumé

Tableau -détails

Boxplots

7b.5 BIRCH - Vérsion 2b

7.5.1 Evaluation du Modèle

7b.5.2 Choisir un Modèle

7b.5.3 Visualisation des Clusters en 2-D

7b.5.4 Distributions des Features par Groupe

Tableau

Boxplots

8. Modèles - Vérsion 3

8.1 Sélection des Features

8.2 Créations des Projections

PCA

MDS

Isomap

t_SNE

-- BREAK Store/Reload Data --

8.3 K-Means - Vérsion 3

8.3.1 Evaluation du Modèle

8.3.2 Choisir un Modèle

8.3.3 Visualisation des Clusters en 2-D

8.3.4 Distributions des Features par Groupe

Tableau -résumé

Tableau -détails

Boxplots

8.4 GaussianMixture - Vérsion 3

8.4.1 Evaluation du Modèle

8.4.2 Choisir un Modèle

8.4.3 Visualisation des Clusters en 2-D

8.4.4 Distributions des Features par Groupe

Tableau -résumé

Tableau -détails

Boxplots

8.5 BIRCH - Vérsion 3

8.5.1 Evaluation du Modèle

8.5.2 Choisir un Modèle

8.5.3 Visualisation des Clusters en 2-D

8.5.4 Distributions des Features par Groupe

Tableau

Boxplots

9. Modèles - Vérsion 4

9.1 Sélection des Features

9.2 Créations des Projections

PCA

MDS

Isomap

t_SNE

-- BREAK Store/Reload Data --

9.3 K-Means - Vérsion 4

9.3.1 Evaluation du Modèle

9.3.2 Choisir un Modèle

9.3.3 Visualisation des Clusters en 2-D

9.3.4 Distributions des Features par Groupe

Tableau -résumé

Tableau -détails

Boxplots

9.4 GaussianMixture - Vérsion 4

9.4.1 Evaluation du Modèle

9.4.2 Choisir un Modèle

9.4.3 Visualisation des Clusters en 2-D

9.4.4 Distributions des Features par Groupe

Tableau -résumé

Tableau -détails

Boxplots

9.5 BIRCH - Vérsion 4

9.5.1 Evaluation du Modèle

9.5.2 Choisir un Modèle

9.5.3 Visualisation des Clusters en 2-D

9.5.4 Distributions des Features par Groupe

Tableau

Boxplots

10. Modèles - Vérsion 5

10.1 Sélection des Features

10.2 Créations des Projections

PCA

MDS

Isomap

t_SNE

-- BREAK Store/Reload Data --

10.3 K-Means - Vérsion 5

10.3.1 Evaluation du Modèle

10.3.2 Choisir un Modèle

10.3.3 Visualisation des Clusters en 2-D

10.3.4 Distributions des Features par Groupe

Tableau -résumé

Tableau -détails

Boxplots

10.4 GaussianMixture - Vérsion 5

10.4.1 Evaluation du Modèle

10.4.2 Choisir un Modèle

10.4.3 Visualisation des Clusters en 2-D

10.4.4 Distributions des Features par Groupe

Tableau -résumé

Tableau -détails

Boxplots

10.5 BIRCH - Vérsion 5

10.5.1 Evaluation du Modèle

10.5.2 Choisir un Modèle

10.5.3 Visualisation des Clusters en 2-D

10.5.4 Distributions des Features par Groupe

Tableau

Boxplots

10b. Modèles - Vérsion 5b

10b.1 Sélection des Features

10b.2 Créations des Projections

PCA

MDS

Isomap

t_SNE

-- BREAK Store/Reload Data --

10b.3 K-Means - Vérsion 5b

10b.3.1 Evaluation du Modèle

10b.3.2 Choisir un Modèle

10b.3.3 Visualisation des Clusters en 2-D

10b.3.4 Distributions des Features par Groupe

Tableau - resumé

Tableau - détails

Boxplots

10b.4 GaussianMixture - Vérsion 5b

10b.4.1 Evaluation du Modèle

10b.4.2 Choisir un Modèle

10b.4.3 Visualisation des Clusters en 2-D

10b.4.4 Distributions des Features par Groupe

Tableau - resumé

Tableau - détails

Boxplots

10b.5 BIRCH - Vérsion 5b

10b.5.1 Evaluation du Modèle

10b.5.2 Choisir un Modèle

10b.5.3 Visualisation des Clusters en 2-D

10b.5.4 Distributions des Features par Groupe

Tableau

Boxplots

11. Comparison des Modèles

12. Agglomerative Clustering